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Введение. Статья посвящена решению задачи формирова- 
ния субоптимальной стратегии уклонения беспилотного 
летательного аппарата в условиях неопределенности те- 
кущих характеристик движения и будущей стратегии по- 
ведения противодействующего ЛА, управление которым 
формируется с максимальной эффективностью. При этом 
траектория маневрирующего ЛА должна удовлетворять 
требованиям оптимальности некоторых заданных функ- 
ций фазовых переменных в конечный момент времени и 
условиям прохождения его траектории через заданную 
терминальную область пространства. Начальные условия 
и динамические возможности уклоняющегося и противо- 
действующего ЛА в начальный момент времени считают- 
ся известными. Управление уклоняющимся ЛА формиру- 
ется его бортовыми средствами навигации и наведения в 
реальном масштабе времени на основе нелинейного пози- 
ционного управления с обратной связью. 

Целью работы является построение алгоритма решения 
задачи синтеза терминально-оптимального управления 
движением центра масс высокоскоростного беспилотного 
летального аппарата, позволяющего осуществлять поиск 
оптимального управления в функции текущих координат 
объекта. Рассмотрение задачи в такой постановке отлича- 
ет ее от классических конфликтных задач о преследова- 
нии, решаемых с привлечением теории дифференциаль- 
ных игр и требует поиска эффективных в вычислительном 
отношении способов ее решения. 

Материалы и методы. Наиболее эффективными для бес- 
пилотных ЛА, функционирующих в условиях интенсив- 
ных возмущений, жестких ограничений на фазовые пере- 
менные и управление, являются так называемые методы 
оптимального терминального управления, реализующие 
адаптивные алгоритмы с прогнозом. Поэтому решение 
сформулированной задачи может быть получено именно 
на основе использования их идеологии. 

Результаты исследования. Разработан новый метод ку- 
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сочно-программного терминального управления движени- 
ем беспилотного ЛА, отличающийся от известных тем, 
что основан на процедуре поиска стратегии управления по 
критерию наилучшего гарантированного результата с 
учетом терминальных ограничений. Разработана методика 
расчета стратегии управления маневром уклонения ЛА в 
медленном контуре терминальной системы управления, 
отличающаяся тем, что вместо процедуры прогноза в 
ускоренном времени и расчета невязок используется про- 
цедура преобразования краевой задачи в одноточечную 
задачу интегрирования системы обыкновенных диффе- 
ренциальных уравнений, учитывающая наличие ненулево- 
го терминального члена в целевом функционале. 
Обсуждение и заключения. Несмотря на то, что формиро- 
вание субоптимальной стратегии наведения в терминаль- 
ную область уклоняющегося ЛА осуществляется не в 
форме синтеза, программное управление адаптируется к 
текущим условиям. Это достигается за счет итерационной 
процедуры регулярного пересчета терминальных условий, 
что эквивалентно периодическому замыканию обратной 
связи. Таким образом, выведение уклоняющегося ЛА в 
заданную терминальную область осуществляется про- 
граммно, а управление уклонением от противодействую- 
щего ЛА формируется в форме синтеза. Ограничениями 
на метод являются условия, что модель движения проти- 
водействующего ЛА известна и он формирует естествен- 
ное управление с целью перехвата уклоняющегося ЛА. 
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Введение. Рассматривается задача формирования субоптимальной стратегии уклонения беспилотного 
летательного аппарата (ЛА) в условиях неопределенности текущих характеристик движения и будущей стратегии 
поведения противодействующего ЛА. При этом траектория уклоняющегося ЛА должна удовлетворять 
требованиям оптимальности некоторых заданных функций фазовых переменных в конечный момент времени, 
определяющих условия прохождения его траектории через заданную терминальную область пространства. 

Начальные условия и динамические возможности уклоняющегося и противодействующего ЛА в 
начальный момент времени считаются известными. Управление уклоняющимся ЛА формируется за счет 
автономных средств его бортовой системы управления в реальном масштабе времени. 

Целью работы является построение эффективного в вычислительном отношении метода решения задачи 
синтеза терминально-оптимального управления движением беспилотного уклоняющегося ЛА в вышеназванных 
условиях. 

Рассмотрение задачи в такой постановке отличает ее от классических конфликтных задач о 
преследовании, решаемых с привлечением теории дифференциальных игр, и требует поиска эффективных в 
вычислительном отношении способов ее решения [1]. Необходимость такой постановки задачи обусловлена 
ограниченными возможностями бортовых цифровых вычислительных машин (ЦВМ) беспилотных ЛА. 

Материалы и методы. Процесс полета уклоняющегося ЛА описывается вектором фазового состоя- 


ния у(1), противодействующего — вектором 2(1), где УЕ К", 2Е К”. 
Динамика взаимного движения описывается нелинейными дифференциальными уравнениями следующего 
вида: 


Машино строение и машиноведение 


ТУТ 
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У(Е)= Л, (+в, (и, у,2,0), УЩ)= У, (1) 
2(:)=Л (2,6) +2,(,5,У,0, 20%)=2, (2) 
где /,,/,, 8.›е, — функции своих аргументов, непрерывные и дифференцируемые достаточное число раз; 
и, У — функции управления соответственно уклоняющимся и противодействующим ЛА, (иЕ А’, уЕЕ’); 
= ее —щ время решения задачи уклонения, [и (1, ‚ соответственно, моменты начала и окончания процесса 


уклонения [2]. 
Для решения задачи заданы некоторые компоненты вектора состояния уклоняющегося ЛА в конечный 


момент [, 1-х 


У (1, ) =У,, 
где (1= ри, п <п), а у, являются заданными краевыми значениями состояния ЛА, образующими требуемую 
терминальную область, являющуюся гладким многообразием следующего вида: 
У (&)-7=Ф, (ув) =0, а (3) 
где Ф, — векторная функция размерности и, х[. 
Условиями задачи задается также требование оптимизации (предположим — максимизации) известной 


скалярной функции остальных и, (и, +п, =п) фазовых переменных вектора у(#,): 


Ё [ны (1, а а а (1, ):и. | =А, (5,1, ) (4) 


В общем случае противодействующий ЛА может быть задействован в любой момент движения 


уклоняющегося ЛА по траектории, проходящей через терминальную область (3). Этот момент времени ® 
начала реализации игры, а также начальные условия свои и противодействующего ЛА в соответствии с ранее 
принятым допущением на борту уклоняющегося ЛА определяются мгновенно и точно. Задачей уклоняющегося 
ЛА в дальнейшем является формирование стратегии уклонения с учетом терминальных ограничений (3), (4). В 
таком случае общее время реализации игры заранее неизвестно и конечный момент времени Е, не фиксирован. 
Поэтому и в соответствии с общепринятым подходом будем считать & параметром (Ц <&, & — 
максимальное время решения задачи, определяемое физическими возможностями игроков, запасами энергии и 
др.), который должен быть выбран в дополнение к управляющей функции уклоняющегося ЛА и (1) так, чтобы 
минимизировать время игры [3]. 
Процесс взаимного движения уклоняющегося и противодействующего ЛА заключается в следующем. 


Целью управляемого движения уклоняющегося ЛА с момента [ является максимизация расстояния от 
противодействующего ЛА в момент #, ‚, а противодействующего ЛА, наоборот, минимизация этого расстояния. 
Соответственно управляющие функции ЛА и (Е) и у(1) в процессе взаимного полета уклонения- 


противодействия должны обеспечивать максимум для уклоняющегося и минимум для противодействующего 
заданной неотрицательной скалярной функции Г, (у,2/) ‚ характеризующей расстояние между ЛА. 
Рациональным является подход, учитывающий ограниченность времени процесса уклонения- 
противодействия, за счет естественной ограниченности на борту взаимодействующих ЛА энергетических ре- 
сурсов, расходуемых на реализацию формируемых управлений, заданных интенсивностями управлений, соот- 


ветственно: 


Ц г 


1, = [У ви? (аи 1, = [Ув (+) 4. 


= о, 
<> 0 
Тогда задачу нахождения допустимых оптимальных стратегии управления (Ц (1) И у (1) необходимо решать 


в условиях максимина: 


У 


Ди,” ) = тахши Рае, 2, (9,24) +5 (7 (Кри (Ки (о) 4 р, (5) 


И 
где К ‚, К, — симметричные положительно определенные матрицы соответствующих размерностей [4]. 


Рассмотрение такой задачи в классической постановке математического аппарата дифференциальных 
игр является затруднительным ввиду особенностей реализации взаимного движения. 
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Значительный объем публикаций, посвященных решению игровых задач в классической постановке, 
предопределяет существенные трудности учета всех известных концепций [2, 5, 6]. В общем случае подходы, 
использующие альтернативное локальное условие существования седловой точки, требуют при их реализации 
значительных вычислительных затрат при решении задачи (1)—(5), что обусловлено сложностью интегрирова- 
ния системы уравнений в частных производных Айзекса и необходимостью достижения условий (3), (4). По- 
этому необходимо учитывать обстоятельство, что в сформулированной частной задаче требуется получить ре- 
шение с точки зрения интересов только лишь одного игрока — уклоняющегося ЛА [7]. В этом случае является 
целесообразным использование одного из частных подходов, который обеспечивает возможность построения 
эффективного в вычислительном отношении бортового алгоритма реализации оптимальной стратегии управле- 
ния уклоняющимся ЛА. Алгоритм базируется на сведении исходной игровой задачи уклонения-перехвата к 
задаче одностороннего управления уклоняющимся ЛА и исключении требования по выполнению условия су- 
ществования седловой точки. 

На основании этого подхода решение задачи поиска оптимальной стратегии управления для уклоняю- 


щегося ЛА и°(ГР) будет уже осуществляться не из условия (5), а из более узкого условия следующего вида: 
Ли’; (2,у,/) ] = шах] Уи, (2,1) й (6) 


При этом управляющая функция противодействующего ЛА У (2, У.) в задаче (1)-—(4) с учетом (6) 


формируется на собственных наблюдениях за движением уклоняющегося ЛА для его перехвата. Также при ре- 
шении задачи необходимо учитывать, что противодействующее ЛА имеет возможность воспользоваться лю- 
бым неоптимальным поведением уклоняющегося ЛА и его замкнутое управление формируется «наилучшим» 
образом по принципу обратной связи без запаздывания [7]. 

Подход к решению подобной задачи, но без учета терминальных ограничений вида (3) рассмотрен в 
работе [8]. Здесь решение основано на поиске субоптимального управления движением ЛА, описываемым 
квазилинейными дифференциальными уравнениями в частных производных, а его недостатком является 
сложность технической реализации ЦВМ беспилотного ЛА. 

В данной работе приводится эффективная в вычислительном отношении методика, в которой для фор- 
мирования субоптимальной стратегии уклоняющегося игрока используется преобразование двухточечной крае- 
вой задачи (ДТКЗ) к одноточечной задаче интегрирования системы обыкновенных дифференциальных уравне- 
ний на основе метода инвариантного погружения (МИП) [8]. 


Однако применение МИП затруднительно для случаев, когда время решения задачи # не фиксировано и 


целевой функционал содержит неквадратичную терминальную составляющую [7]. Поэтому на данном шаге 
вместо МИП используется метод решения краевой задачи, рассмотренный в работе [9]. 
Тогда получается следующее решение задачи формирования субоптимальной стратегии управления 


уклоняющегося ЛА и°(1) в конфликтной задаче о преследовании с терминальными ограничениями и незадан- 


ным временем реализации игры (1)—(4), (6). 
Для динамической системы в игровой задаче уклонения-перехвата 


(г) =Л(х,1)- = (х,и,у, г) . х(&) =№, № = р. , (7) 
совокупность необходимых условий экстремума функционала (6), определяющих оптимальную стратегию 


0 а ь 
управления уклоняющегося игрока и (1) при условии, что противодействующий ЛА формирует позиционное 


управление с обратной связью У (х,г) имеет вид [2, 8]: 


т 








где х=у 2, хеА"", =, и. =, @&, 
Н(х,и,у,^, Г) Е. (х,г)-0.55" (х,1) Ку (х,#)-+0.5и" (1) Ки (#)- 
+А/” (1). 7 (х,2)+^” (1) 2 (х,и,У,1) | 


2 


Га 
(= |0 вы ^ (1), 


=ш 1 | х(#),и(1),(х,г) (Е) ] |= из { 0.5" (#) Ки (1) + (05 (хи, 5,6) |= Н (х,^,4), 
при этом сформированная субоптимальная траектория х({) и вектор сопряженных переменных ^.(!) описы- 


ваются следующими уравнениями ДТКЗ: 
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О-а-в лы" 9-м О] ВН белы) - 
= Л. (5,1), х(%) =, (8) 


де(х.^, де(х.^.. 6)" 
С. (х,^.1) — к ел Л 


Е О лы 





ОХ ОХ 2 ОХ ОХ 
у» Г=ЬП, 
(1) =4 ОГ (Хх, А 9 
(^.) __ т. р = +Ь пт +И,, х=х(ь ), | 
у=-М/ У, 
. игл 08, (х,м, г) 05, (х,и, г) у В игл 08, (х,м,г) " игл 08, (х,и,г) у 
мнт пб бы Ан А И, и" (Е) К, + ^, (И ЧЕ, 
и=и (2) . 

| ЭГ (х,и,1) и де (х,и,!) ” в 

А к || ЕЕ ия Л р А^()=|/7 0 > 
где ®— введенная в [7] операция блочного произведения блочных матриц; у — постоянный вектор п, х1 


множителей Лагранжа для терминальной (геометрической) связи (3); Л,М, ‚ у — матрицы п хп, пхп и 
вектор п, х| соответственно; / — единичная матрица размерности п, х п.. 
Время окончания игры {, находится при этом из дополнительного скалярного уравнения 
ОГ (х,в,) 


2, +Н(х, ,5,^,1,)=0, (10) 


. . $ — 0 — 
где |] =1(ь) для | =Х,И .У,Л. 
< —1 
Существование обратной матрицы М, определяется условием управляемости преследуемого объекта 


и, кроме того, т конечных условий для № (6) не определены [10]. 


Для простоты рассуждений можно воспользоваться упрощенным способом преобразования краевой за- 
дачи к одноточечной задаче интегрирования системы обыкновенных дифференциальных уравнений, при инте- 


грировании которой вместо оптимальной траектории х (+) получают приближение х(1) [11]. 








Обозначим 
_ Ой Е 
О(х, в )= о р и. (11) 
Тогда вместо соотношений (8)—(10) получим: 
х(1)=М, (х,0,1) (зо, )-м.(.0) х. 
Хх 
СО (Хх, . р - 
О И ь 
М, (&, О, #) ли (5х, О, еж (3, 0,1), (13) 
М, (5, 9,1) ое (5, О, м, (5, 0,1), (14) 
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где О=О(х,1), в 


(2 (1), пу _ 9,0 
07. | 07. 


Для матриц чувствительности М, — заданы начальные условия следую- 


щего вида: 
М, =0; М, =Е, (15) 

где Е — единичная матрица размерности (и+т)х(и+т). 
Результатом интегрирования системы дифференциальных уравнений (12—15) является субоптимальная 
У’ 20’ 


тиводействующего ЛА и доставку полезной нагрузки в требуемую конечную область (3). 


Т 
‚ которая обеспечивает его уклонение от про- 








программная траектория уклоняющегося ЛА х(Ё) = 


Синтезируемая субоптимальная траектория Х(Г) адаптируется к текущим условиям функционирования 


уклоняющегося ЛА по результатам идентификации его динамических характеристик. 

Траектория получена на основе представления о наиболее вероятных действиях противодействующего 
ЛА для перехвата уклоняющегося ЛА и с учетом ограниченности энергетики уклоняющегося ЛА в задаче при- 
земления в заданную область (3). Однако стратегия поведения, основанная на однократно определенной про- 
граммной траектории, не обладает свойством адаптации и приводит к большим методическим ошибкам [12, 
13]. 

Исходя из того, что решение двухточечной краевой задачи получено приближенным методом и модель 
движения обоих игроков не всегда адекватна функционированию реальных ЛА, необходимо увеличивать ча- 
стоту обновления навигационных измерений (уменьшить такт решения навигационной задачи). Это в конечном 
счете приведет к получению близкого к оптимальному (субоптимальному) решения задачи оптимального 
управления в форме синтеза. При этом устойчивость решения задачи может быть обеспечена рациональным 
выбором такта для контура наведения ЛА. 

Использование алгоритмов с прогнозированием для ЛА различного назначения показало их высокую 
эффективность вследствие присущего им свойства адаптации к текущим условиям полета и изменяющимся 
характеристикам ЛА [14, 15, 16]. 

Применение для маневрирующих беспилотных ЛА оптимального терминального управления для раз- 
работки адаптивных алгоритмов с прогнозом обеспечивает высокое качество их функционирования в условиях 
действия возмущений большой интенсивности при наличии жестких ограничений на параметры траектории и 
управление [7]. 

По этой причине окончательный выбор решения сформулированной задачи может быть сделан в поль- 
зу использования методологии синтеза алгоритма с прогнозирующими моделями [14]. 

Методика формирования управления уклоняющимся ЛА в форме синтеза основывается на следующем 
[17]. 

С использованием текущих навигационных измерений определяются начальные условия х(Ё/)=х/ 
(1=0, 1, 2,... — номер итерации в блоке), и в длиннопериодическом («медленном») контуре решения задачи 
наведения прогнозируется субоптимальная траектория Х”(Г) на последующий интервал движения уклоняюще- 


‚И >В). В короткопериодическом («быстром») контуре решается задача стабилиза- 


р о _ 
гося ЛА! Е | &,Т | (в = 
ции движения ЛА относительно субоптимальной траектории Х(!) на интервале времени до пересчета управле- 


ния в контуре наведения. 
В течение одной итерации построения программной оптимальной траектории в «медленном» контуре 


наведения по текущей навигационной информации ) в «быстром» контуре стабилизации выполняется не- 
0 


сколько итераций [18]. При этом задача навигации решается с тактом, меньшим или равным такту «быстрого» 
контура [19]. Соответственно, такт решения задачи в «быстром» контуре определяется динамическими харак- 
теристиками уклоняющегося ЛА для обеспечения требований устойчивости, управляемости и др., а такт длин- 
нопериодического контура ограничен вычислительными характеристиками бортовой ЦВМ. Такое кусочно- 
программное управление на интервале времени медленного контура при уменьшении такта будет стремиться к 
замкнутому управлению в форме синтеза [2]. 

Результаты исследования. С целью проверки работоспособности, реализуемости и оценки характери- 
стик вычислительной эффективности представленного подхода было выполнено численное моделирование. В 
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качестве уклоняющегося ЛА использовалась модель гипотетического беспилотного летательного аппарата, 
технические характеристики которого заданы в соответствии с приведенными в работе [20]. 

Так как полная модель такого типа ЛА обладает чрезмерной сложностью и трудоемкостью, то приняты 
упрощающие допущения о линейной аппроксимации коэффициентов аэродинамических сил и моментов. В 
этом случае размерность модели равна 12, она линейна относительно вектора управления и в векторной форме 
имеет вид (1). С целью упрощения численных исследований рассматривался участок полета в плоскости дви- 
жения без маневрирования по углу атаки в течение временного интервала Т=100 с. Поэтому углы разворота 
рулей высоты и направления задавались постоянными и равными 0, а управление формировалось только за счет 
изменения силы тяги ЛА, действующей вдоль его продольной оси. 

Модель противодействующего ЛА задана ракетной осесимметричной схемой, а его движение определя- 
лось в той же системе координат и в той же плоскости движения и описывалось четырьмя известными детер- 
минированными дифференциальными уравнениями, которые в векторной форме имели вид (2) [15, с. 79]. При 
этом «неизвестное» уклоняющемуся ЛА управление противодействующего ЛА синтезировалось оптимально по 
принципу Беллмана — путем минимизации функции промаха [21, 22] 


О[у(в,),=(в,)] =0,5( (и-=) +№ (У,-5,) , (16) 


1, 





где у.,7 — компоненты фазовых векторов объектов (их координаты в плоскости стрельбы); К, — масштаби- 
рующие коэффициенты ( 1=1,2). 

При этом использовалось предположение, не влияющее на общность полученных результатов, что про- 
тиводействующему ЛА «мгновенно» известна текущая информации о взаимном расположении обоих ЛА и его 
управление синтезируется без временной задержки [2, 8, 15]. 

Для моделирования было выбрано два практических случая управления уклоняющимся ЛА. В первом 
случае формировалось программное релейное управление с одним переключением на 30-й секунде полета с 
режима полета с уровнем средней тяги на форсированный режим с уровнем максимальной тяги. Моделирова- 
ние показало, что ЛА перехватывал уклоняющийся ЛА на 61-й секунде, т.е. задача уклонения с положительным 
исходом не решалась. 

При моделировании второго случая процесса уклонения синтезировалось управление уклоняющимся ЛА 
на основе сформированной методики из условия максимизации функции промаха (16). При учете энергетиче- 
ских возможностей обоих ЛА и использовании сформированного исходного критерия вида (5) оптимальная 


функция управления тягой двигательной установки уклоняющегося ЛА Р/;\ (1) имела релейный вид с двумя 


переключениями с минимального значения уровня тяги Р.. на максимальный уровень Ро, 


Моделирование подтвердило эффективность такой стратегии управления. Задача уклонения решалась с 
положительным исходом. 

Таким образом, моделирование подтвердило, что формирование управления с возможностью переклю- 
чения тяги двигательной установки с кратностью два и более обеспечивает большую техническую возможность 
уклонения и адаптации к характеристикам противодействующего ЛА. 

При моделировании размерность системы дифференциальных уравнений, интегрируемой в прямом вре- 
мени, была равна 380. 

Требуемое быстродействие бортовой ЦВМ системы управления составило величину не более 1.4*10° 
Коп/сек, для числа операций контура наведения — около 7*10* Коп с тактом 0,5 сек. Это подтверждает возмож- 
ность реализации алгоритма управления в реальном масштабе времени на современных ЦВМ [15, 19]. 

Применение для формирования управления традиционного минимаксного подхода на основе решения 
уравнений в частных производных приводит к алгоритму, включающему реализацию дополнительных специа- 
лизированных численных методов, существенно увеличивающих вычислительные затраты, и в рассмотренном 
случае высоких размерностей динамических объектов (12 и 4 соответственно) практически нереализуемо на 
борту в реальном масштабе времени [23]. 

Результаты моделирования приведены на рис. 1-3. 
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Рис. 1. График линейных скоростей беспилотного ЛА по осям х,у,7 (м/с) 
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Рис. 2. График угловых скоростей беспилотного ЛА по осям х,у,7 (рад/с) 
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Рис. 3. График координат движения беспилотного ЛА по осям х,у,7 (м) 
Ето. 3. Отарй оГтоуетет! соот@теез оГИАТ аюпг х,У,7, ахез (т) 


Результаты моделирования процесса уклонения ЛА демонстрируют работоспособность алгоритма и 
возможность его реализации на современных бортовых ЭВМ в реальном времени. 

Обсуждение и заключения. Несмотря на то, что формирование субоптимальной стратегии наведения 
уклоняющегося ЛА в заданную терминальную область осуществляется не в форме прямого синтеза, многоша- 
говый пересчет программного управления позволяет адаптироваться к текущим условиям. Это достигается за 
счет многошаговой итерационной процедуры регулярного пересчета терминальных условий, что эквивалентно 
периодическому замыканию обратной связи. Таким образом, выведение уклоняющегося ЛА в заданную терми- 
нальную область осуществляется программно, а управление уклонением от противодействующего ЛА эквива- 
лентно формированию управления в форме синтеза. Ограничениями на применение метода являются условия, 
что модель движения противодействующего ЛА известна и он формирует естественное управление с целью 
перехвата уклоняющегося ЛА. 
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